Scan- & OCR-Services
Wenn Sie Informationen auf Papier vorliegen haben und Sie diese in ein EDV-System übernehmen möchten, benötigen Sie dafür ein Gerät zur optischen Erfassung des Papiers.
In vielen Fällen ist aber nicht nur das Abbild des Gedruckten wichtig, sondern auch die darin enthaltene Information. Wenn Sie einen Text überarbeiten wollen, ein Zahl in eine Datenbank zu übergeben ist, muss die Information ausgelesen werden.
Das Zauberwort heißt hier Texterkennung, englisch "optical character recognition" (OCR) - beileibe kein trivialer Vorgang. Denn 100%ig korrekte Texterkennungsergebnisse sind oft nur mit manuellen Korrekturen des erkannten Textes möglich. Mal ist ein Wort schlecht gedruckt oder durchgestrichen, oder ein Scan zu hell oder zu dunkel gemacht worden.
Sollen nur bestimmte Informationen aus einer Seite übernommen werden, z.B. bei Rechnungen oder Arbeitszeitbelegen, ist diese aus der gesamten Seite zu extrahieren.
Die mit Abstand schwierigste Aufgabe ist jedoch Handschrifterkennung - hier sind die Fehlerraten bei der Erkennung noch relativ hoch, lassen sich aber über Plausibilitätskontrollen, wie z.B. dem Abgleich mit Orts-/Straßenverzeichnissen, verbessern.
Die Umsetzung des Services hängt also nicht nur vom zu scannenden Material ab, vor allem aber von der Aufgabenstellung. Was soll mit den Daten geschehen?